该论文为罗马尼亚语提供了一个开放域的答案系统,回答了Covid-19相关问题。QA系统管道涉及自动问题处理,自动查询生成,Web搜索前10个最相关的文档,并使用用于提取质量质量质量质量质量质量质量的BERT模型回答提取,并在我们手动创建的COVID-19数据集上进行了培训。该论文将介绍质量检查系统及其与罗马尼亚语言技术的集成,COVID-19数据集以及对质量检查性能的不同评估。
translated by 谷歌翻译
本文介绍了来自Robin项目的新罗马尼亚语音语料库,称为Robin技术获取语音语料库(Rocintasc)。其主要目的是提高会话代理的行为,允许人机互动在购买技术设备的背景下。本文包含采集过程的详细描述,语料库统计信息以及对低延迟ASR系统以及对话组件的语料库影响的评估。
translated by 谷歌翻译
通过一系列联邦举措和命令,美国政府一直在努力确保美国在AI中的领导。这些广泛的战略文件影响了美国空军美国部(DAF)等组织。DAF-MIT AI加速器是DAF和MIT之间的一项计划,以弥合AI研究人员与DAF任务要求之间的差距。DAF-MIT AI加速器支持的几个项目正在开发公共挑战问题,这些问题解决了许多联邦AI研究的重点。这些挑战是通过公开可用的大型AI-Ready数据集,激励开源解决方案,并为可以激发进一步研究的双重使用技术创建需求信号,来针对优先事项。在本文中,我们描述了正在开发的这些公共挑战以及它们的应用如何促进科学进步。
translated by 谷歌翻译
在考虑收集训练数据集测量的复杂性时,对自动目标识别(ATR)进行自动目标识别(ATR)的有希望的潜力消失了。模拟可以通过生成合成训练数据集来克服此问题。但是,由于模拟的代表性有限,在处理测试时间进行实际测量时,以合成图像的经典方式训练的模型具有有限的概括能力。以前的作品确定了一组同样有希望的深度学习算法来解决此问题。但是,这些方法已在非常有利的情况下通过合成训练数据集进行了评估,该数据集过于拟合测量的测试数据的基础真相。在这项工作中,我们研究了这种理想条件以外的ATR问题,这在实际的操作环境中不太可能发生。我们的贡献是三倍。 (1)使用mocem Simulator(由Scalian DS为法国MOD/DGA开发),我们生成了一个合成的MSTAR训练数据集,该数据集与实际测量值显着不同。 (2)我们通过实验证明了最先进的限制。 (3)我们表明,可以将域随机化技术和对抗训练结合在一起以克服此问题。我们证明,这种方法比最先进的方法更强大,精度为75%,同时对培训期间的计算性能影响有限。
translated by 谷歌翻译
自我监督的学习是一种从自然数据中学习有用表示的强大方法。还建议作为在人类中建立视觉表现的一种可能手段,但具体的目标和算法是未知的。目前,大多数自我监督的方法都鼓励系统学习与其他图像相反的相同图像的不同变换的不变表示。然而,这种变换通常是非生物学上的,并且通常由具有随机裁剪和颜色抖动之类的具有相识的感知方案组成。在本文中,我们试图反向工程师这些增强术语更加生物学或感知可符号,同时仍然赋予鼓励鲁棒代表的相同益处。批判性地,我们发现随机裁剪可以被皮质倍率代替,并且图像的扫视样品也可以帮助表示学习。这些转变的可行性表明,生物视觉系统可以实施自我监督的潜在方式。此外,它们打破了许多计算机视觉算法中使用的广泛接受的空间均匀的处理假设,这表明在人类和机器中的空间自适应计算的作用。我们可以在此处找到我们的代码和演示。
translated by 谷歌翻译
神经网络在许多领域都很受欢迎,但它们具有对远离训练数据的示例提供高信心响应的问题。这使得神经网络在其预测中非常有信心的同时进行错误,从而限制了它们对自主驾驶,空间探索等的安全关键应用的可靠性,我们提出了具有标准点产品的神经元泛化基于神经元和RBF神经元作为形状参数的两个极端情况。使用Relu作为激活功能,我们获得具有紧凑载体的新型神经元,这意味着其输出在有界域之外为零。我们展示了如何通过首先训练标准神经网络训练这种神经元的神经网络训练神经网络的困难,然后逐渐将形状参数逐渐增加到所需值。我们还证明,使用所提出的神经元的神经网络具有通用近似性,这意味着它可以近似具有任意精度的任何连续和可积的功能。通过对标准基准数据集的实验,我们展示了所提出的方法的承诺,因为它可以在分布式样品上具有良好的预测准确性,同时能够始终如一地检测并对分布外样品具有低置信度。
translated by 谷歌翻译